건강 정보학은 방대한 의료 데이터를 수집하고 분석하여 환자 치료와 공중보건 정책의 개선에 기여하는 핵심 분야입니다. 복잡한 임상 기록부터 유전체 정보에 이르기까지 다양한 정보를 체계화함으로써 더 빠르고 정확한 의료 결정을 내릴 수 있도록 돕는 것이 이 분야의 목표입니다.

Gist.Science 는 이 분야에서 매일 medRxiv 에 게시되는 최신 연구들을 직접 확인하며, 새로운 프리프린트 논문이 나올 때마다 즉시 처리합니다. 우리는 각 논문에 대해 전문적인 기술적 요약과 일반인도 쉽게 이해할 수 있는 쉬운 설명을 모두 제공하여, 연구 결과의 본질을 빠르고 명확하게 전달하고자 합니다.

아래에는 건강 정보학 분야의 최신 연구 논문들이 정리되어 있으니, 최신 의학 데이터의 흐름을 확인해 보시기 바랍니다.

Development of a natural language processing application to extract and categorize mentions of violence from mental healthcare records text

이 논문은 영국 남동부 런던의 정신건강 진료 기록에서 다양한 형태의 폭력과 관련된 정보를 추출하고 분류하기 위해 다중 레이블 BERT 모델을 활용한 자연어 처리 애플리케이션을 개발하여, 기존 연구보다 폭력 식별 성능을 크게 향상시켰음을 보고합니다.

Li, L., Sondh, S., Sondh, H. K., Stewart, R., Roberts, A.2026-03-26📄 health informatics

A statistical framework for evaluating the repeatability and reproducibility of large language models

이 논문은 FDA 의 AI 기반 의료 소프트웨어 가이드라인을 바탕으로 의미적 및 내부적 차원을 정량화하여 대규모 언어 모델 (LLM) 의 반복성과 재현성을 평가하는 통계적 프레임워크를 개발하고, 다양한 프롬프트 전략과 데이터셋을 통해 이를 검증했습니다.

Shyr, C., Ren, B., Hsu, C.-Y., Yan, C., Tinker, R. J., Cassini, T. A., Hamid, R., Wright, A., Bastarache, L., Peterson, J. F., Malin, B. A., Xu, H.2026-03-25📄 health informatics

Wearable-derived cardiovascular fitness age and its lifestyle correlates in 442 adults

본 연구는 442 명의 성인을 대상으로 한 12 개월 분석을 통해, 웨어러블 기기에서 도출된 심혈관 연령이 수면 효율, 수면 시간, 일일 걸음 수 및 체질량 지수 (BMI) 와 같은 독립적인 생활 습관 요인과 유의미하게 연관되어 있으며, 시간이 지남에 따라 생리학적 변화를 추적할 수 있음을 입증했습니다.

Shanmugam, A., Gupta, K., Dhawale, N., Singhal, V., Kumar, M., Srinivasan, B., Narasimhan, V.2026-03-25📄 health informatics

Human-supervised, large language model-based clinical decision support aligned to national newborn protocols in Kenya: a pragmatic, early-stage evaluation

케냐의 저자원 신생아 진료 환경에서 국가 프로토콜에 부합하도록 설계된 인간 감독형 대규모 언어 모델 기반 임상 의사결정 지원 시스템 (AIFYA) 이 높은 사용자 수용도와 전문가 평가 일치도를 보이며 성공적으로 구현되었음을 실증한 초기 평가 연구입니다.

Kuria, T., Kamau, G., Makokha, F., Omondi, P., Mbugua, G., David, K., Mbugua, S., Gitaka, J.2026-03-25📄 health informatics

The Power of Open Health Data: Impact, Representation, and Knowledge Diffusion

이 논문은 오픈 건강 데이터가 연구비 규모와 무관하게 약 10 배의 간접 인용 확대 효과를 창출하지만, 저소득국 연구자의 참여와 성별 불평등 등 구조적 격차는 데이터 접근성 정책만으로는 해결되지 않음을 보여줍니다.

Gorijavolu, R., Armengol de la Hoz, M. A., Bielick, C., Cajas, S., Charpignon, M.-L., El Mir, A., Gichoya, J. W., Kwak, H. G., Madapati, K., Mattie, H., McCullum, L., Mwavu, R., Nair, V., Nakayama, L. (…)2026-03-24📄 health informatics

Social Determinants of Health and Chronic Disease Risk Prediction in the All of Us Research Program

'All of Us' 연구 프로그램의 대규모 데이터를 활용하여 정신 건강과 심대사 질환 예측에 사회적 결정 요인과 인구통계학적 요인이 미치는 영향을 분석한 결과, 정신 건강은 스트레스나 차별 같은 경험적 요인이, 심대사 질환은 인구통계학적 및 구조적 요인이 더 중요한 예측 변수임을 규명하고 질환별 맞춤형 사회적 개입의 필요성을 제시했습니다.

Kammer-Kerwick, M., Dave, Y., Parekh, V., McDonald, L., Watkins, S. C.2026-03-23📄 health informatics

Impact of a Social Media Derived Digital Self Management Platform on Population Level Irritable Bowel Syndrome Emergency Utilization: A Controlled Interrupted Time Series Analysis Using South Korean National Health Insurance Data

본 연구는 소셜 미디어 기반의 환자 담론을 반영하여 개발된 디지털 자기 관리 플랫폼 '장건강'이 한국 국민건강보험 데이터를 통해 분석된 결과, 과민성 대장증후군으로 인한 응급실 방문 및 입원율을 유의하게 감소시켰음을 보여줍니다.

Park, J.-H., Lim, A.2026-03-23📄 health informatics

Automated Extraction of Cancer Registry Data from Pathology Reports: Comparing LLM-Based and Ontology-Driven NLP Platforms

이 논문은 존스홉킨스 병원의 병리 보고서 670 건을 대상으로 LLM 기반의 Brim Analytics 와 온톨로지 기반의 DeepPhe 를 비교한 결과, Brim Analytics 이 췌장암과 유방암 모두에서 높은 정확도와 처리 속도를 보여 자동화된 암 등록 데이터 추출에 효과적임을 입증했습니다.

McPhaul, T., Kreimeyer, K., Baris, A., Botsis, T.2026-03-23📄 health informatics